Neste seção temos a uma descrição dos dados, que poderá ser melhor
visualizado na Tabela 1. No caso, nosso variável de interesse é
trsgi, que apresenta mÃnimo de 0.4 e máximo de 1.94
aproximadamente. Série completa apresenta 1534 observações, das quais
1552 foram usadas como série de treino e 12 para série de teste.
Desca-se que a frequência utilizada foi de 12 meses
(h=12).
| age_CE | trsgi | numsamp | |
|---|---|---|---|
| Min. : 441.0 | Min. :0.4000 | Min. : 1.00 | |
| 1st Qu.: 824.2 | 1st Qu.:0.8305 | 1st Qu.: 3.00 | |
| Median :1207.5 | Median :0.9860 | Median : 9.00 | |
| Mean :1207.5 | Mean :1.0000 | Mean :14.17 | |
| 3rd Qu.:1590.8 | 3rd Qu.:1.1470 | 3rd Qu.:26.00 | |
| Max. :1974.0 | Max. :1.9420 | Max. :39.00 |
Temos abaixo a série e o histograma da mesma. Pelo histograma, podemos notar que a série parece possuir certa normalidade com uma leve cauda à direita, porém o teste de Shapiro-Wilk indicou um p-valor menor que 0.05.
Série Análisada
Série Análisada
As Tabelas 2, 3 e 4, apresentam os resultados dos testes de raiz unitária, tendência determinÃstica e sazonalidade. Por conseguite, a série não apresentou nenhuma destas caracterÃsticas.
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Augmented Dickey-Fuller | Tendencia | 0.01 | NAO tendencia |
| Phillips-Perron Unit Root | Tendencia | 0.01 | NAO tendencia |
| KPSS Test for Level | NAO tendencia | 0.10 | NAO tendencia |
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Cox Stuart | NAO tendencia | 0.6911 | NAO tendencia |
| Cox and Stuart Trend | NAO tendencia | 0.6371 | NAO tendencia |
| Mann-Kendall Trend | NAO tendencia | 0.2007 | NAO tendencia |
| Mann-Kendall | NAO tendencia | 0.2007 | NAO tendencia |
| KPSS Test for Trend | NAO tendencia | 0.1000 | NAO tendencia |
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Kruskall Wallis | NAO Sazonal | 0.8854 | NAO Sazonal |
| Friedman rank | NAO Sazonal | 0.8896 | NAO Sazonal |
Ao todo foram criados dois modelos, um apenas com médias móveis e um outro modelos apenas com a estrutura autorregressiva.
O primeiro modelo é do tipo AR(3) com \(\text{AIC}=-962.9\) e \(\text{BIC}=-936.26\).
A Tabela 5, apresenta os resultados das métricas do modelo 1. No conjunto de treinamento, o Erro Médio (ME) foi de 0.0002, indicando que o modelo não apresenta viés sistemático, ou seja, não tende a subestimar ou superestimar as previsões de forma consistente. Por outro lado, no conjunto de teste, o ME foi de -0.0598, sugerindo uma leve tendência do modelo a superestimar os valores reais quando aplicado a dados não vistos. Quanto à Raiz do Erro Quadrático Médio (RMSE), observou-se um valor de 0.1757 no treinamento e 0.1184 no teste, o Erro Percentual Absoluto Médio (MAPE) foi de 14.46% no treinamento e 13.10% no teste, indicando que, em média, as previsões do modelo apresentam um desvio percentual em torno de 14% nos dados de treino e 13% nos dados de teste. Em sÃntese, o modelo demonstrou um bom desempenho preditivo, com métricas consistentes e até mesmo melhores no conjunto de teste em comparação ao treinamento.
| ME | RMSE | MAE | MAPE | |
|---|---|---|---|---|
| Training set | 0.0002 | 0.1757 | 0.1329 | 14.4641 |
| Test set | -0.0598 | 0.1184 | 0.1047 | 13.1075 |
coeftest(mod1.1)
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ar1 0.519065 0.025457 20.3896 < 2.2e-16 ***
## ar2 0.117253 0.028598 4.1001 4.130e-05 ***
## ar3 0.117388 0.025486 4.6059 4.106e-06 ***
## intercept 0.999861 0.018237 54.8267 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
A seguir, são apresentados os resultados da análise dos resÃduos. Em que os resÃduos não apresentam autocorrelação pelo teste de Ljung-Box, indicando que o modelo foi razoável no ajuste.
##
## Ljung-Box test
##
## data: Residuals
## Q* = 32.318, df = 24, p-value = 0.1193
##
## Model df: 0. Total lags used: 24
Por fim, o gráfico abaixo é um demonstração da série real, os valores ajustado e os valores previstos.
O segundo modelo criado, paresenta apenas estuturas de médias móveis MA(10), com \(\text{AIC}=-962.66\) e \(\text{BIC}=-898.72\).
coeftest(mod1.2)
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ma1 0.510781 0.025535 20.0032 < 2.2e-16 ***
## ma2 0.380012 0.028548 13.3114 < 2.2e-16 ***
## ma3 0.356115 0.029747 11.9713 < 2.2e-16 ***
## ma4 0.336264 0.030410 11.0576 < 2.2e-16 ***
## ma5 0.227622 0.030957 7.3529 1.939e-13 ***
## ma6 0.193580 0.031577 6.1304 8.764e-10 ***
## ma7 0.194425 0.030655 6.3423 2.263e-10 ***
## ma8 0.150404 0.030533 4.9259 8.397e-07 ***
## ma9 0.138065 0.027341 5.0498 4.423e-07 ***
## ma10 0.078911 0.025649 3.0766 0.002094 **
## intercept 1.000289 0.015960 62.6732 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
A Tabela 6, apresenta o resultados das métricas que avaliam a qualidade do ajuste do modelo em questão. No conjunto de treinamento, o modelo apresentou um Erro Médio (ME) de 0.0002, demonstrando equilÃbrio nas previsões, sem tendência sistemática de sub ou superestimação. Contudo, no conjunto de teste, observou-se um ME de -0.0880, indicando o surgimento de um viés negativo quando aplicado a dados não vistos. Quanto à precisão das previsões, o modelo apresentou RMSE de 0.1749 no treinamento e 0.1487 no teste. Por último, a análise do MAPE revelou valores de 14.4428% e 16.7124% para treinamento e teste, respectivamente. Esta diferença de aproximadamente 2.27 pontos percentuais indica um desempenho ligeiramente inferior em dados não vistos, ainda que dentro de uma margem considerada aceitável para muitas aplicações práticas.
| ME | RMSE | MAE | MAPE | |
|---|---|---|---|---|
| Training set | 0.0002 | 0.1749 | 0.1327 | 14.4428 |
| Test set | -0.0880 | 0.1487 | 0.1336 | 16.7124 |
A seguir, temos a análise de resÃduos do modelo, em que pelo teste de Ljung-Box os resÃduos não apresentam autocorrelção, indicando um bom ajueste do modelo.
##
## Ljung-Box test
##
## data: Residuals
## Q* = 18.12, df = 24, p-value = 0.7971
##
## Model df: 0. Total lags used: 24
Por fim, o gráfico abaixo é um demonstração da série real, os valores ajustado e os valores previstos.